{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 8,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "'D:\\\\工作相关内容\\\\公司项目\\\\禁限运危化品货源\\\\dangerous_goods.csv'"
      ]
     },
     "execution_count": 8,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "import pandas as pd\n",
    "#设置value的显示长度为100，默认为50\n",
    "pd.set_option('max_colwidth',1000)\n",
    "data_path  = r'D:\\工作相关内容\\公司项目\\禁限运危化品货源\\dangerous_goods.csv'\n",
    "data_path"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 13,
   "metadata": {},
   "outputs": [],
   "source": [
    "df = pd.read_csv(data_path,sep='\\001')\n",
    "df = df[[\"merge_result\",\"key_word\"]]\n",
    "df.head()\n",
    "df.to_csv(\"D:\\工作相关内容\\公司项目\\禁限运危化品货源\\dangerous_goods_new.csv\")"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 12,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>merge_result</th>\n",
       "      <th>key_word</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>5272</th>\n",
       "      <td>你这个化工塑料颗粒到这个米吨的给多少钱了吧？#啊。#我十三米七五的平板。#集中90啥时候装？#今天装是吧？#喂喂。#这能不能高一点吧，老板高不了了吗？#在100的信息费吧。#多少钱？#我的车建设31团卸货呢，31团离这个地方有多远？31团。#哎，对。#31团卸货了我的车。#这两个地方是不对的。#哦，一百多公里可以，过了几十块钱一吨啊，可以装33吨吧。#我的车可以装33吨。#哦。#行那，我加一下你微信说电话号码了吧？我也没短信给你装电号码。#呼兰高速装的后来。#那个他卸车快一点吊车吊吨半折，柜台吊车吊篮就过来了吧，因为我的地方100公里路嘛，我就过来了吧。#130。#9915。#523号。#嗯1309615。#嗯。#血液制品有限公司啊。#嗯。#嗯，好嘞。#嗯，好嘞。#啊。----------喂，你好。#半挂车。#半挂车吗？#啊。#到90块钱73车。#一天吧。#啊，对，今天装。#高不了了。#质量。#你是200。#三十一川。#31吨的歌吗？#我知道我知道你31团的吗？#我这个货是在库尔勒库尔勒西。#到了期限。#你什么呀？31乘31你看你。#你现有个。#你你有个60公里库尔勒有40公里。#1米七三又十几公里，一百多公里吧。#33。#啊，应该没问题。#啊，最少32吨。#一吨货。#你现在你现在姓啥货？#啊，说卸完嘞。#哦。#行行行，那我加你微信你微信多少？#130。#9915。#232。#啊。#57。#喂。#啊，对对对。#好。</td>\n",
       "      <td>血液制品</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>95549</th>\n",
       "      <td>啊，你好。#你那个合肥到茂名那个拉什么货啊？#啊。#血液制品不是钢筋什么呀？#啊啊啊。#啊。#给多少钱啊？#啊啊。#我说。#在光说多少钱你们出多少钱？#到茂名发钱。#哎，那边太太低了。#你到广州到广州价格差不多，到茂名还是三四百公里路。#嗯，不能高了吧？----------喂。#啊啊。#啊，那个。#车那个哪啊？#啊，那个帖子，坪。#啊，不是干净就是。#链条啊，那个走啊，那一类的啊。#多少钱是吧？#我是多少钱啊？#喂。#我说你说多少钱？#啊。#啊，我们一步到位8000啊啊。#啊。#啊。#那我们只能给到8000哪啊？#好嘞好。</td>\n",
       "      <td>血液制品</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    merge_result  \\\n",
       "5272   你这个化工塑料颗粒到这个米吨的给多少钱了吧？#啊。#我十三米七五的平板。#集中90啥时候装？#今天装是吧？#喂喂。#这能不能高一点吧，老板高不了了吗？#在100的信息费吧。#多少钱？#我的车建设31团卸货呢，31团离这个地方有多远？31团。#哎，对。#31团卸货了我的车。#这两个地方是不对的。#哦，一百多公里可以，过了几十块钱一吨啊，可以装33吨吧。#我的车可以装33吨。#哦。#行那，我加一下你微信说电话号码了吧？我也没短信给你装电号码。#呼兰高速装的后来。#那个他卸车快一点吊车吊吨半折，柜台吊车吊篮就过来了吧，因为我的地方100公里路嘛，我就过来了吧。#130。#9915。#523号。#嗯1309615。#嗯。#血液制品有限公司啊。#嗯。#嗯，好嘞。#嗯，好嘞。#啊。----------喂，你好。#半挂车。#半挂车吗？#啊。#到90块钱73车。#一天吧。#啊，对，今天装。#高不了了。#质量。#你是200。#三十一川。#31吨的歌吗？#我知道我知道你31团的吗？#我这个货是在库尔勒库尔勒西。#到了期限。#你什么呀？31乘31你看你。#你现有个。#你你有个60公里库尔勒有40公里。#1米七三又十几公里，一百多公里吧。#33。#啊，应该没问题。#啊，最少32吨。#一吨货。#你现在你现在姓啥货？#啊，说卸完嘞。#哦。#行行行，那我加你微信你微信多少？#130。#9915。#232。#啊。#57。#喂。#啊，对对对。#好。   \n",
       "95549                                                                                                                                                                                                                                                                                                                                                                   啊，你好。#你那个合肥到茂名那个拉什么货啊？#啊。#血液制品不是钢筋什么呀？#啊啊啊。#啊。#给多少钱啊？#啊啊。#我说。#在光说多少钱你们出多少钱？#到茂名发钱。#哎，那边太太低了。#你到广州到广州价格差不多，到茂名还是三四百公里路。#嗯，不能高了吧？----------喂。#啊啊。#啊，那个。#车那个哪啊？#啊，那个帖子，坪。#啊，不是干净就是。#链条啊，那个走啊，那一类的啊。#多少钱是吧？#我是多少钱啊？#喂。#我说你说多少钱？#啊。#啊，我们一步到位8000啊啊。#啊。#啊。#那我们只能给到8000哪啊？#好嘞好。   \n",
       "\n",
       "      key_word  \n",
       "5272      血液制品  \n",
       "95549     血液制品  "
      ]
     },
     "execution_count": 12,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "temp = df[df['key_word'] ==\"血液制品\"]\n",
    "temp.head(10)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "df_save = df[[\"merge_result\"]]\n",
    "\n",
    "data_path  = r'D:\\工作相关内容\\公司项目\\禁限运危化品货源\\dangerous_goods.csv'\n",
    "def save_conversation_to_file(serices):\n",
    "    conversation = serices['merge_result']\n",
    "    key_word = serices['key_word']"
   ]
  }
 ],
 "metadata": {
  "interpreter": {
   "hash": "6fdb461f17ccc0ab15145fba195d3345c5139a62bce9b216a9d0c5235fe7d64d"
  },
  "kernelspec": {
   "display_name": "Python 3.6.2 64-bit ('cangjie-gateway': conda)",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.8.8"
  },
  "orig_nbformat": 4
 },
 "nbformat": 4,
 "nbformat_minor": 2
}
